Вы находитесь на странице: 1из 3

Big Data

Big Data (datos masivos) es el proceso de recoleccin de grandes cantidades de


datos y su inmediato anlisis para encontrar informacin oculta, patrones
recurrentes, nuevas correlaciones, etc.; el conjunto de datos es tan grande y
complejo que los medios tradicionales de procesamiento son ineficaces.
Y es que estamos hablando de desafos como analizar, capturar, recolectar,
buscar, compartir, almacenar, transferir, visualizar, etc., ingentes cantidades de
informacin, obtener conocimiento en tiempo real y poner todos los sentidos en la
proteccin de datos personales. El tamao para albergar todo el proceso ha ido
aumentando constantemente para poder recopilar e integrar toda la informacin.
Para resumir, se puede utilizar 5 Vs como definicin de Big Data (empezaron
siendo 3), que es lo que caracteriza al sistema y al mismo tiempo explica sus
ventajas:
Volumen. La ms evidente y la que hacer honor al nombre; captar y organizar
absolutamente toda la informacin que nos llega es esencial para tener registros
completos e insesgados, y que las conclusiones que obtengamos sirvan
eficientemente a la hora de la toma de decisiones. Es el Business Intelligence que
todos conocemos, pero a lo grande; aunque la diferencia con la clsica inteligencia
de negocio viene marcada por el resto de Vs.
Velocidad. Siempre es importante el tiempo si afrontamos tanto la necesidad de
generar informacin (y recordemos que estamos hablando de muchos datos)
como de analizarla, pero lo es ms si necesitamos reaccionar inmediatamente;
todo el proceso pide agilidad para extraer valor de negocio a la informacin que se
estudia y que no se pierda la oportunidad.
Variedad. Hay que dar uniformidad a toda la informacin, que tendr su origen en
datos de lo ms heterogneos, tal como veremos en el siguiente apartado. Una de

las fortalezas del Big Data reside en poder conjugar y combinar cada tipo de
informacin y su tratamiento especfico para alcanzar un todo homogneo.
Veracidad. Se refiere a la calidad del dato y su disponibilidad; en un entorno
descrito por la anterior V, Variedad, hay que encontrar herramientas para
comprobar la informacin recibida; las tecnologas creadas al servicio del Big Data
se muestran imprescindibles y eficientes para afrontar los retos.
Valor. Trabajar con Big Data tiene que servir para aportar valor a la sociedad, las
empresas, los gobiernos, en definitiva, a las personas; todo el proceso tiene que
ayudar a impulsar el desarrollo, la innovacin y la competitividad, pero tambin
mejorar la calidad de vida de las personas.

Tipos de datos en Big Data


Para aclarar qu es lo que se recoge para el anlisis, podemos dividirlos en dos
grandes categoras:

Datos estructurados: Aquellos que tienen longitud y formato (por ejemplo


fechas) y que pueden ser almacenados en tablas (como las bases de datos
relacionales). En esta categora entran los que se compilan en los censos
de poblacin, los diferentes tipos de encuestas, los datos de transacciones
bancarias, las compras en tiendas online, etc.

Datos no estructurados: Son los que carecen de un formato determinado


y no pueden ser almacenados en una tabla. Pueden ser de tipo texto (los
que generan los usuarios de foros, redes sociales, documentos de Word), y
los de tipo no-texto (cualquier fichero de imagen, audio, vdeo). Dentro de
esta categora, podemos aadir los Datos semiestructurados, que son los
que no pertenecen a bases de datos relacionales ya que no se limitan a
campos determinados, aunque poseen organizacin interna o marcadores
que facilita el tratamiento de sus elementos; estaramos hablando de
documentos XML, HTML o los datos almacenados en bases de datos
NoSQL.

ANLISIS DE BIG DATA


El anlisis de 'grandes datos' es el proceso de examinar grandes cantidades de
datos de una variedad de tipos (big data) para descubrir patrones ocultos,
correlaciones desconocidas y otra informacin til.
El objetivo principal del anlisis de datos grandes es ayudar a las empresas a
tomar mejores decisiones de negocios al permitir a los cientficos y otros usuarios
de datos analizar grandes volmenes de datos transaccionales, as como otras
fuentes de datos que puedan haber quedado sin explotar por la inteligencia de
negocio convencional (BI) programas.

Estas fuentes de datos pueden incluir registros del servidor web y datos de
seguimiento de clics en internet, informes de actividades sociales, medios de
comunicacin, telfonos mviles registros detallados de llamadas y la informacin
captada por los sensores.
Algunas personas asocian exclusivamente grandes datos y anlisis de grandes
volmenes de datos con datos no estructurados de ese tipo, pero consultoras
como Gartner y Forrester Research Inc. tambin consideran las transacciones y
otros datos estructurados como formas vlidas de datos grandes.
El anlisis de big data puede hacerse con herramientas de software de uso comn
en el marco de disciplinas analticas avanzadas, como el anlisis predictivo y la
minera de datos.
Las tecnologas relacionadas con el anlisis de datos incluyen bases de datos
grandes NoSQL, Hadoop y MapReduce. Estas tecnologas forman el ncleo de un
marco de software de cdigo abierto que soporta el procesamiento de grandes
volmenes de datos a travs de sistemas en clster.

Вам также может понравиться