Академический Документы
Профессиональный Документы
Культура Документы
Su importancia, desafos y
gobernabilidad
Big Data es un trmino que describe el gran volumen de datos, tanto estructurados como no estructurados,
que inundan los negocios cada da. Pero no es la cantidad de datos lo que es importante. Lo que importa con
el Big Data es lo que las organizaciones hacen con los datos. Big Data se puede analizar para obtener
ideas que conduzcan a mejores decisiones y movimientos de negocios estratgicos.
1. Qu es Big Data?
Cuando hablamos de Big Data nos referimos a conjuntos de datos o combinaciones de conjuntos de datos
cuyo tamao (volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan su
captura, gestin, procesamiento o anlisis mediante tecnologas y herramientas convencionales, tales
como bases de datos relacionales y estadsticas convencionales o paquetes de visualizacin, dentro del tiempo
necesario para que sean tiles.
Aunque el tamao utilizado para determinar si un conjunto de datos determinado se considera Big Data no est
firmemente definido y sigue cambiando con el tiempo, la mayora de los analistas y profesionales actualmente
se refieren a conjuntos de datos que van desde 30-50 Terabytes a varios Petabytes.
La naturaleza compleja del Big Data se debe principalmente a la naturaleza no estructurada de gran parte
de los datos generados por las tecnologas modernas, como los web logs, la identificacin por radiofrecuencia
(RFID), los sensores incorporados en dispositivos, la maquinaria, los vehculos, las bsquedas en Internet, las
redes sociales como Facebook, computadoras porttiles, telfonos inteligentes y otros telfonos mviles,
dispositivos GPS y registros de centros de llamadas.
En la mayora de los casos, con el fin de utilizar eficazmente el Big Data, debe combinarse con datos
estructurados(normalmente de una base de datos relacional) de una aplicacin comercial ms convencional,
como un ERP (Enterprise Resource Planning) o un CRM (Customer Relationship Management).
La recopilacin de grandes cantidades de datos y la bsqueda de tendencias dentro de los datos permiten
que las empresas se muevan mucho ms rpidamente, sin problemas y de manera eficiente. Tambin les
permite eliminar las reas problemticas antes de que los problemas acaben con sus beneficios o su reputacin.
El anlisis de Big Data ayuda a las organizaciones a aprovechar sus datos y utilizarlos para identificar
nuevas oportunidades. Eso, a su vez, conduce a movimientos de negocios ms inteligentes, operaciones ms
eficientes, mayores ganancias y clientes ms felices. Las empresas con ms xito con Big Data consiguen valor de
las siguientes formas:
Reduccin de coste. Las grandes tecnologas de datos, como Hadoop y el anlisis basado en la nube, aportan
importantes ventajas en trminos de costes cuando se trata de almacenar grandes cantidades de datos, adems
de identificar maneras ms eficientes de hacer negocios.
Ms rpido, mejor toma de decisiones. Con la velocidad de Hadoop y la analtica en memoria, combinada con
la capacidad de analizar nuevas fuentes de datos, las empresas pueden analizar la informacin inmediatamente
y tomar decisiones basadas en lo que han aprendido.
Nuevos productos y servicios. Con la capacidad de medir las necesidades de los clientes y la satisfaccin a
travs de anlisis viene el poder de dar a los clientes lo que quieren. Con la analtica de Big Data, ms empresas
estn creando nuevos productos para satisfacer las necesidades de los clientes.
Por ejemplo:
Turismo: Mantener felices a los clientes es clave para la industria del turismo, pero la satisfaccin del cliente
puede ser difcil de medir, especialmente en el momento oportuno. Resorts y casinos, por ejemplo, slo tienen
una pequea oportunidad de dar la vuelta a una mala experiencia de cliente. El anlisis de Big data ofrece a
estas empresas la capacidad de recopilar datos de los clientes, aplicar anlisis e identificar inmediatamente
posibles problemas antes de que sea demasiado tarde.
Cuidado de la salud: El Big Data aparece en grandes cantidades en la industria sanitaria. Los registros de
pacientes, planes de salud, informacin de seguros y otros tipos de informacin pueden ser difciles de manejar,
pero estn llenos de informacin clave una vez que se aplican las analticas. Es por eso que la tecnologa de
anlisis de datos es tan importante para el cuidado de la salud. Al analizar grandes cantidades de informacin -
tanto estructurada como no estructurada - rpidamente, se pueden proporcionar diagnsticos u opciones de
tratamiento casi de inmediato.
Administracin: La administracin se encuentra ante un gran desafo: mantener la calidad y la productividad
con unos presupuestos ajustados. Esto es particularmente problemtico con lo relacionado con la justicia. La
tecnologa agiliza las operaciones mientras que da a la administracin una visin ms holstica de la actividad.
Retail: El servicio al cliente ha evolucionado en los ltimos aos, ya que los compradores ms inteligentes
esperan que los minoristas comprendan exactamente lo que necesitan, cuando lo necesitan. El Big Data ayuda a
los minoristas a satisfacer esas demandas. Armados con cantidades interminables de datos de programas de
fidelizacin de clientes, hbitos de compra y otras fuentes, los minoristas no slo tienen una comprensin
profunda de sus clientes, sino que tambin pueden predecir tendencias, recomendar nuevos productos y
aumentar la rentabilidad.
Empresas manufactureras: Estas despliegan sensores en sus productos para recibir datos de telemetra. A
veces esto se utiliza para ofrecer servicios de comunicaciones, seguridad y navegacin. sta telemetra tambin
revela patrones de uso, tasas de fracaso y otras oportunidades de mejora de productos que pueden reducir los
costos de desarrollo y montaje.
Publicidad: La proliferacin de telfonos inteligentes y otros dispositivos GPS ofrece a los anunciantes la
oportunidad de dirigirse a los consumidores cuando estn cerca de una tienda, una cafetera o un restaurante.
Esto abre nuevos ingresos para los proveedores de servicios y ofrece a muchas empresas la oportunidad de
conseguir nuevos prospectos.
Otros ejemplos del uso efectivo de Big Data existen en las siguientes reas:
o Uso de registros de logs de TI para mejorar la resolucin de problemas de TI, as como la deteccin de
infracciones de seguridad, velocidad, eficacia y prevencin de sucesos futuros.
o Uso de la voluminosa informacin histrica de un Call Center de forma rpida, con el fin de mejorar la
interaccin con el cliente y aumentar su satisfaccin.
o Uso de contenido de medios sociales para mejorar y comprender ms rpidamente el sentimiento del cliente
y mejorar los productos, los servicios y la interaccin con el cliente.
o Deteccin y prevencin de fraudes en cualquier industria que procese transacciones financieras online,
tales como compras, actividades bancarias, inversiones, seguros y atencin mdica.
o Uso de informacin de transacciones de mercados financieros para evaluar ms rpidamente el riesgo y
tomar medidas correctivas.
Estas 5 caractersticas del big data provocan que las empresas tengan problemas para extraer datos reales y de
alta calidad, de conjuntos de datos tan masivos, cambiantes y complicados.
Hasta la llegada del Big Data, mediante ETL podamos cargar la informacin estructurada que tenamos
almacenada en nuestro sistema ERP y CRM, por ejemplo. Pero ahora, podemos cargar informacin adicional
que ya no se encuentra dentro de los dominios de la empresa: comentarios o likes en redes sociales,
resultados de campaas de marketing, datos estadsticos de terceros, etc. Todos estos datos nos ofrecen
informacin que nos ayuda a saber si nuestros productos o servicios estn funcionando bien o por el contrario
estn teniendo problemas.
Algunos desafos a los que se enfrenta la calidad de datos de Big Data son:
Solo el 20% de informacin es estructurada y eso puede provocar muchos errores si no acometemos un proyecto
de calidad de datos.
Es difcil recolectar, limpiar, integrar y obtener datos de alta calidad de forma rpida. Se necesita mucho tiempo
para transformar los tipos no estructurados en tipos estructurados y procesar esos datos.
3. Mucha volatilidad
Los datos cambian rpidamente y eso hace que tengan una validez muy corta. Para solucionarlo
necesitamos un poder de procesamiento muy alto.
Si no lo hacemos bien, el procesamiento y anlisis basado en estos datos puede producir conclusiones
errneas, que pueden llevar a cometer errores en la toma de decisiones.
Estas normas necesitan madurar y perfeccionarse. Adems, la investigacin sobre la calidad de datos de big
data ha comenzado hace poco y no hay apenas resultados.
La calidad de datos de big data es clave, no solo para poder obtener ventajas competitivas sino tambin impedir
que incurramos en graves errores estratgicos y operacionales basndonos en datos errneos con
consecuencias que pueden llegar a ser muy graves.
4. Cmo construir un plan de Data Governance en Big data
Gobernabilidad significa asegurarse de que los datos estn autorizados, organizados y con los permisos
de usuario necesarios en una base de datos, con el menor nmero posible de errores, manteniendo al
mismo tiempo la privacidad y la seguridad.
Esto no parece un equilibrio fcil de conseguir, sobre todo cuando la realidad de dnde y cmo los datos se alojan
y procesan est en constante movimiento.
A continuacin veremos algunos pasos recomendados al crear un plan de Data Governance en Big Data.
Se pueden lograr estos controles granulares a travs de las expresiones de control de acceso. Estas
expresiones usan agrupacin y lgica booleana para controlar el acceso y autorizacin de datos flexibles, con
permisos basados en roles y configuraciones de visibilidad.
En el nivel ms bajo, se protegen los datos confidenciales, ocultndolos, y en la parte superior, se tienen
contratos confidenciales para cientficos de datos y analistas de BI. Esto se puede hacer con capacidades
de enmascaramiento de datos y diferentes vistas donde se bloquean los datos en bruto tanto como sea posible y
gradualmente se proporciona ms acceso hasta que, en la parte superior, se da a los administradores una mayor
visibilidad.
Con la autenticacin, se trata de ver cmo integrarse con LDAP [Lightweight Directory Access Protocol],
Active Directory y otros servicios de directorio. Tambin se puede dar soporte a herramientas como Kerberos
para soporte de autenticacin. Pero lo importante es no crear una infraestructura separada, sino integrarla en
la estructura existente.
Una vez superado el permetro y con acceso al sistema, proteger los datos de PII es extremadamente
importante. Es necesario encriptar esos datos de forma que, independientemente de quin tenga acceso a
l, puedan ejecutar los anlisis que necesiten sin exponer ninguno de esos datos.
Estamos en la infancia de Big Data e IoT (Internet de Cosas), y es fundamental poder rastrear el acceso y
reconocer patrones en los datos.
La auditora y el anlisis pueden ser tan simples como el seguimiento de los archivos de JavaScript Object Notation
(JSON).
Va ms all de un conjunto de reglas de seguridad. Es una arquitectura nica en la que se crean estos roles y
se sincronizan a travs de toda la plataforma y todas las herramientas que se aportan a ella.
Google se ve incapaz de poder indexar la web al nivel que exige el mercado y por ello decide buscar una
solucin, que se basa en un sistema de archivos distribuidos, haciendo suyo el lema divide y vencers.
Esta solucin, que posteriormente se denominar Hadoop, se basa en un gran nmero de pequeos ordenadores,
cada uno de los cuales se encarga de procesar una porcin de informacin. La grandiosidad del sistema es que, a
pesar de que cada uno de ellos funciona de forma independiente y autnoma, todos actan en conjunto,
como si fueran un solo ordenador de dimensiones increbles.
En 2006, Google publica todos los detalles acerca de su nuevo descubrimiento, compartiendo su conocimiento y
experiencia con todos los usuarios que anhelaban acceder a esta informacin. Entre el conjunto de beneficiarios,
destaca el inters de la comunidad Open Source que, apasionados por la idea y el nuevo horizonte que se abre
frente a ellos, explotan sus posibilidades desarrollando una implementacin a la que denominan Hadoop.
A partir de ese momento, es Yahoo quien toma el relevoimpulsando su expansin, para lograr alcanzar a grandes
e icnicas empresas en el mundo de la informtica, como Facebook, que empiezan a incorporarlo a sus rutinas, a
disfrutar de su uso y a participar en su desarrollo, junto con la comunidad Open Source.
Qu es Hadoop?
Hadoop es un sistema de cdigo abierto que se utiliza para almacenar, procesar y analizar grandes
volmenes de datos. Sus ventajas son muchas:
HDFS
Consiste en un sistema de archivo distribuido, que permite que el fichero de datos no se guarde en una nica
mquina sino que sea capaz de distribuir la informacin a distintos dispositivos.
MAPREDUCE
Se trata de un framework de trabajo que hace posible aislar al programador de todas las tareas propias de
laprogramacin en paralelo. Es decir, permite que un programa que ha sido escrito en los lenguajes de
programacinms comunes, se pueda ejecutar en un cluster de Hadoop.
La gran ventaja es que hace posible escoger y utilizar el lenguaje y las herramientar ms adecuadas para la tarea
concreta que se va a realizar.
Tienes dudas de cmo empezar tu proyecto de Big Data? Resuelve tus dudas con un experto
Esta circunstancia comporta que, aquella informacin que antes las empresas no podan procesar debido a los
lmites de la tecnologa existente o a barreras de tipo econmico, que se hacan insalvables en muchos casos; hoy
pueda ser almacenada, gestionada y analizada, gracias a Hadoop.
Cualquier organizacin que utilice Hadoop puede obtener informacin nueva, al mismo tiempo que descubre y
aplica cualquier otro tipo de anlisis a sus datos, como por ejemplo una regresin lineal sobre millones de
registros de su histrico.
Es precisamente por ello que se est expandiendo tanto su uso entre las empresas que se benefician de:
A su vez, para minimizar los riesgos de su aplicacin, existen en el mercado distintas distribuciones de
Hadoop con soporte 24/7, de esta forma ya no es necesario depender de la comunidad Open Source para
solucionar este tipo de cuestiones; lo que ha contribuido a impulsar en gran medida su adopcin en entornos
productivos.
Desde 2001, Green Mountain Coffee se ha convertido en uno de los principales tostadores del caf Fair Trade.
Tambin estamos involucrados en esfuerzos globales y locales para mejorar continuamente las condiciones de vida de
nuestros productores y sus familias.
Evaluar en tiempo casi real. Crear un ciclo de retroalimentacin oportuna. Dar a los agentes el entrenamiento
personalizado que anhelan. Encuentre dnde los agentes se colgaban con el anlisis de escritorio.
Mejorar el rendimiento del agente. Es sencillo. Los agentes ms comprometidos son mejores agentes.
AutoZone es el detallista lder en refacciones para autos. Siempre encontrars las mejores refacciones y
accesorios de repuesto para autos, camionetas y ...
NuoDB
De Wikipedia, la enciclopedia libre
NuoDB
Logotipo de NuoDB
Fundado 2008
Nmero de 85 [1]
empleados
NuoDB es una empresa de bases de datos con sede en Cambridge, Massachusetts . Fundada en 2008, NuoDB ha
sido reconocida en el Cuadrante Mgico de Gartner [3] y su tecnologa es utilizada por Dassault Systmes ,
Kodiak, Alfa Systems y UAE Exchange . [4][5]
La Nike+ FuelBand SE es un potente dispositivo de seguimiento de actividad que usas alrededor de la mueca,
como un reloj.
Siempre que ests activo durante el da, la tecnologa de deteccin de movimiento de la FuelBand SE capta tus
movimientos y los convierte en NikeFuel. El NikeFuel que ganas se registra a medida que trabajas para lograr la
meta diaria que has establecido para ti mismo.
Podrs ver el progreso hacia tu Meta diaria en FuelBand SE en la aplicacin gratuita Nike+ FuelBand para Android,
o bien, en la aplicacin Nike+ Fuel para iOS y en tu cuenta Nike+.
Puedes subir todo el NikeFuel ganado a tu cuenta gratuita Nike+. Debido a que todos tus datos de actividad se
almacenan de forma permanente en Nikeplus.com, con el tiempo, tu cuenta se convertir en un recurso valioso
para el seguimiento de las tendencias de actividad y para el reconocimiento del progreso por el que has pasado
para ser ms activo.
SmartBand Talk SWR30. Hblale. Lleva un registro de tu vida con ella. Llamadas de voz y
notificaciones; Acelermetro y altmetro; Pantalla de tinta electrnica: ...
La elegante pulsera de actividad SmartBand Talk SWR30 de Sony tiene una pantalla curva y funcin de
llamada.
Consulta los datos de la semana, el mes o el ao pasado, o incluso antes, en tu SmartBand 2 a travs de la
aplicacin Lifelog. Mira la lnea de tiempo a lo largo de las otras entradas de Lifelog, incluyendo eventos, fotografas
y msica. Mira cmo las diferentes actividades, como un da festivo o escuchar tu cancin favorita, pueden alterar
tu pulso y esfuerzo corporal, y aprende a equilibrar tu vida.
Lo bueno El Jawbone Up24 es un monitor de ejercicio increblemente placentero y fcil de usar que cuenta tus
pasos, sueo y caloras. El Up24 es ligero, cmodo y resistente al agua. El dispositivo se sincroniza con
telfonos va Bluetooth.
Lo malo Al Jawbone Up24 le hace falta una pantalla para poder ver rpidamente tu progreso. El Up24 y la
aplicacin Up 3.0 funcionan solamente con dispositivos con iOS.
Conclusin Si para ti no es una prioridad que tenga una pantalla o que funcione con Android, la excelente
aplicacin, los tiles consejos y la comodidad del Up24 son difciles de resistir.
Sears, Roebuck and Co., una subsidiaria de propiedad de Sears Holdings Corporation (NASDAQ: SHLD), es un
minorista integrado lder en el suministro de mercancas y servicios relacionados y forma parte de Shop Your
Way, una experiencia de compras social donde los miembros tienen la capacidad de ganar puntos y recibir
beneficios a travs de una amplia variedad de formatos fsicos y digitales a travs de shopyourway.com . Sears,
Roebuck ofrece su amplia gama de productos para el hogar, prendas de vestir y productos y servicios
automotrices a travs de tiendas de lnea completa y especializadas de marca Sears y afiliadas en los Estados
Unidos. Sears, Roebuck tambin ofrece una variedad de mercancas y servicios a travs de sears.com,
landsend.com y catlogos especializados. Sears, Roebuck ofrece a los consumidores marcas lderes
como Kenmore , Craftsman y DieHard , entre las marcas ms confiables y preferidas en Estados Unidos. La
compaa es el mayor proveedor de servicios a domicilio del pas, con ms de 14 millones de llamadas de
servicio e instalacin realizadas anualmente.
The Boeing Company es una empresa multinacional estadounidense4 que disea, fabrica y
vende aviones, helicpteros, misiles y satlites y proporciona asesoramiento y servicio tcnico. Boeing es uno de
los mayores fabricantes de aeronaves del mundo, el segundo contratista de defensa del mundo, segn datos
de 2013,5y el mayor exportador de Estados Unidos en funcin del valor del dlar.67 Sus acciones se encuentran en
el Promedio Industrial Dow Jones.
La sede central de Boeing se encuentra en Chicago y la compaa est liderada por el presidente y CEO Dennis
Muilenburg
El CEO (Chief Executive Officer, tal reza su denominacin en idioma ingls) o Director Ejecutivo, Consejero Delegado,
Presidente Ejecutivo o Principal Oficial Ejecutivo, como tradicionalmente se lo llam hasta que la globalizacin trajo
aparejado innumerables reformas sociales, polticas, econmicas y de trminos tambin, es la persona que tiene a su
cargo la mxima autoridad de la gestin y direccin administrativa en una empresa, organismo, asociacin o institucin.
El CEO u oficial superior, en realidad, es un cargo y una denominacin que por aos existi excluyentemente en las
corporaciones anglosajonas, en tanto, por lo que hablbamos ms arriba de la globalizacin y sus subsidiarias es que el
trmino dej de ser una exclusividad anglosajona para pasar a ser tambin una realidad en otras culturas y hoy en da es
un trmino comn y corriente para todos, que se aplica mayoritariamente en las empresas de perfil tecnolgico.
Apache Hadoop es un framework de software que soporta aplicaciones distribuidas bajo una licencia libre.1
Permite a las aplicaciones trabajar con miles de nodos y petabytes de datos. Hadoop se inspir en los
documentos Google para MapReduce y Google File System (GFS).
Hadoop es un proyecto de alto nivel Apache que est siendo construido y usado por una comunidad global de
contribuyentes,2 mediante el lenguaje de programacin Java. Yahoo! ha sido el mayor contribuyente al proyecto,3 y
usa Hadoop extensivamente en su negocio.4
Hadoop fue creado por Doug Cutting,5 que lo nombr as por el elefante de juguete de su hijo.6 Fue desarrollado
originalmente para apoyar la distribucin del proyecto de motor de bsqueda, denominado Nutch.7