Академический Документы
Профессиональный Документы
Культура Документы
•Siempre es difícil identificar como surgen los conceptos y paradigmas. “Big Data”
no supone una excepción a esta regla siendo difícil identificar si surge como
consecuencia o acompañante de otros conceptos como el “Open Data”.
• El concepto datos abiertos (open data, en inglés) es una filosofía y práctica que
persigue que determinados tipos de datos estén disponibles de forma libre para
todo el mundo, sin restricciones de derechos de autor, de patentes o de otros
mecanismos de control. Tiene una ética similar a otros movimientos y
comunidades abiertos, como el software libre, el código abierto (open source, en
inglés) y el acceso libre (open access, en inglés)
• La popularización del término Big Data viene, sin duda, ligada al documento del
concepto publicado por McKinsey Global Institute en Junio de 2011, en el cual se
define como “conjuntos de datos cuyo tamaño va más olió de la capacidad de
captura, almacenado, gestión y análisis de las herramientas de base de datos
tradicionales”
1.2. LOS DATOS (LA VIDA) EN LA NUBE: BIG DATA Y
CLOUD COMPUTING.
El uso de cloud computing para entornos de big data, nos va a permitir escalar las
infraestructuras necesarias y capacidades de almacenamiento en función de las
necesidades empresariales. Cualquier empresa podrá tener acceso, en cada
momento específico, a los recursos óptimos para el análisis y almacenamiento de
los datos.
Además con el desarrollo del cloud computing y big data, existen empresas
proveedoras que “acomodan” sus servicios a las necesidades tecnológicas del big
data. Esto implica la posibilidad de usar herramientas específicas de Big data como
Hadoop o MongoDB en la nube.
1.3.El Significado de Big Data.
Esta palabra se ha utilizado para trasladar al público todo tipo de
conceptos entre los que se incluyen grandes cantidades de
datos, analítica de redes sociales, herramientas de última
generación para gestionar los datos, datos en tiempo real y
mucho más.
Entonces entendemos que Big Data es toda esa información
estructurada y no estructurada a la cual se le puede obtener un
valor mediante decisiones.
1.4. Volumen, Variedad y
Velocidad (las3V’s).
Volumen: hace referencia a las cantidades masivas de datos que
las organizaciones intentan aprovechar para mejorar la toma
de decisiones en toda la empresa. Los volúmenes de datos
continúan aumentado a un ritmo sin precedentes.
Variedad: gestionar la complejidad de múltiples tipos de datos,
incluidos los datos estructurados, semiestructurados y no
estructurados.
Velocidad: la que se crean, procesan y analizan los datos
continúa aumentando. Contribuir a una mayor velocidad es la
naturaleza en tiempo real de la creación de datos, así como la
necesidad de incorporar datos en streaming a los procesos de
negocio y la toma de decisiones.
1.5. Big Analytics.
Concepto que agrupa las tecnologías y desarrollos matemáticos
que se dedican a almacenar, analizar y cruzar toda esa
información para intentar encontrar patrones de
comportamiento. O lo que es lo mismo, atar cabos de cuáles son
nuestros hábitos y costumbres.
1.6. Plataforma de código abierto
“Hadoop”