Вы находитесь на странице: 1из 4

Sistemas Espaciales de Teledeteccin

Satlites Landsat y Sentinel


Universidad Nacional de Trujillo Valle Jequetepeque
Ingeniera Informtica
Zegarra Arana Juan Alexander Saavedra Saldaa Manuel Humberto
Guadalupe, Per Guadalupe, Per
juze@hotmail.es manuelsaavedra11@gmail.com

Resumen Big data, macrodatos, datos masivos, inteligencia de Estas bases de datos NoSQL buscan solventar las
datos o datos a gran escala es un concepto que hace referencia a limitaciones que el modelo relacional se encuentra en entornos
conjuntos de datos tan grandes que aplicaciones informtica de almacenamiento masivo de datos y concretamente en las
tradicionales del procesamiento de datos no son suficientes para que tiene en el momento de escalar, donde es necesario
tratar con ellos y a los procedimientos usados para encontrar
patrones repetitivos dentro de esos datos.
disponer de servidores muy potentes y de balanceo de carga.
Estos problemas que ha buscado resolver NoSQL tienen una
En informtica, NoSQL (a veces llamado "no slo SQL") es una profunda relacin con BigData.
amplia clase de sistemas de gestin de bases de datos que difieren
del modelo clsico de SGBDR (Sistema de Gestin de Bases de
Datos Relacionales, en ingls, RDBMS) en aspectos importantes, ENTONCES, QU ES NOSQL?
siendo el ms destacado que no usan SQL como lenguaje principal
de consultas.
NoSQL es un sistema de gestin de bases de datos que
Palabras clave Big data Satlite, datos masivos, inteligencia difiere del modelo clsico de gestin relacional. Los datos
de datos o datos a gran escala, no slo SQL. almacenados no requieren estructuras fijas como tablas,
normalmente no soportan las operaciones JOIN, ni garantizan
I. INTRODUCCIN completamente ACID (Atomicidad, coherencia, aislamiento y
durabilidad), y habitualmente escalan bien horizontalmente.
Del gran volumen de informacin, esta existe en una gran
variedad de datos que pueden ser representados de diversas Una vez que NoSQL solucion los problemas de gestin de
maneras en todo el mundo, por ejemplo de dispositivos grandes cantidades de informacin surgi BigData.
mviles, audio, video, sistemas GPS, incontables sensores
digitales en equipos industriales, automviles, medidores QU ES BIGDATA?
elctricos, veletas, anemmetros, etc., los cuales pueden medir
y comunicar el posicionamiento, movimiento, vibracin,
BigData agrupa las tcnicas de almacenamiento, anlisis y
temperatura, humedad y hasta los cambios qumicos que sufre
manejo de inmensos repositorios de datos, estos son tan
el aire, de tal forma que las aplicaciones que analizan estos
inmensos que resulta imposible tratarlos con las herramientas
datos requieren que la velocidad de respuesta sea lo demasiado
de bases de datos y analticas convencionales. BigData Centra
rpida para lograr obtener la informacin correcta en el
sus caractersticas en tres partes:
momento preciso. Estas son las caractersticas principales de
una oportunidad para Big Data.
Volumen. Grandes volmenes de datos, a partir de
TeraBytes o incluso PetaBytes.
II. BIG DATA Y NOSQL
Variedad. El concepto de BigData tambin suele
En 1998 nace el trmino NoSQL usado para identificar venir acompaado de diversos tipos de fuentes de
aquellas bases de datos que no seguan el modelo relacional. datos, sean estructurados o no estructurados.

En 2009 el trmino fue aceptado de manera general


estableciendo cuatro tipos de bases de datos no relacionales: Velocidad. La frecuencia de las actualizaciones de
estas grandes bases de datos tambin es un punto a
tener en cuenta. Es por ello por lo que su
Bases de datos de pares Llave-Valor.
procesamiento y posterior anlisis tambin ha de
Bases de datos documentales.
realizarse prcticamente en tiempo real para poder
Bases de datos de almacenamiento por columna. mejorar la toma de decisiones en base a la
Bases de datos de Grafos. informacin generada.
BigData, en trminos generales puede referirse a la tendencia
en el avance de la tecnologa que ha abierto las puertas hacia
un nuevo enfoque de entendimiento y toma de decisiones, la Datos semiestructurados:
cual es utilizada para describir enormes cantidades de datos Datos que no se limitan a campos determinados, pero que
(Estructurados, no estructurados y semi estructurados) que contiene marcadores para separar los diferentes
tomara demasiado tiempo y sera muy costoso cargarlos a una elementos. Es una informacin poco regular como para
base de datos relacional para su anlisis. De tal manera que, el ser gestionada de una forma estndar. Estos datos poseen
concepto de BigData aplica para toda aquella informacin que sus propios metadatos semiestructurados19 que describen
no puede ser procesada o analizada utilizando procesos o los objetos y las relaciones entre ellos, y pueden acabar
herramientas tradicionales. Sin embargo, BigData no se refiere siendo aceptados por convencin. Un ejemplo es el
a alguna cantidad en especfico, ya que es usualmente utilizado HTML, el XML o el JSON.
cuando se habla en trminos de petabytes y exabytes de datos.

GigaByte = 1,000,000,000 DE DNDE PROVIENEN TODOS ESTOS DATOS?


TeraByte = 1,000,000,000,000
PetaByte = 1,000,000,000,000,000 Un iPhone hoy en da tiene ms capacidad de cmputo que la
ExaByte = 1,000,000,000,000,000,000 NASA cuando el hombre lleg a la luna por lo que la cantidad
de datos generados por persona y en unidad de tiempo es muy
grande. Catalogamos la procedencia de los datos segn las
siguientes categoras:

GENERADOS POR LAS PERSONAS:


El hecho de enviar correos electrnicos o mensajes por
WhatsApp, publicar un estado en Facebook, tuitear contenidos
o responder a una encuesta por la calle son cosas que hacemos
a diario y que crean nuevos datos y metadatos que pueden ser
analizados. Se estima que cada minuto al da se envan ms de
200 millones de correos electrnicos, se comparten ms de
700 000 piezas de contenido en Facebook, se realizan dos
Fig. 1. Escala de base de datos nosql vs la tradicional. millones de bsquedas en Google o se editan 48 horas de
vdeo en YouTube. Por otro lado, las trazas de utilizacin en
un sistema ERP, incluir registros en una base de datos o
BIG DATA introducir informacin en una hoja de clculo son otras formas
de generar estos datos.
TECNOLOGA
Transacciones de datos:
Existen muchsimas herramientas para tratar con big data.
Algunos ejemplos incluyen Hadoop, NoSQL, Cassandra, La facturacin, las llamadas o las transaccin entre cuentas
Inteligencia empresarial, Aprendizaje automtico y generan informacin que tratada pueden ser datos relevantes.
MapReduce. Estas herramientas tratan con algunos de los tres Un ejemplo ms claro lo encontraremos en las transacciones
tipos de big data: bancarias: lo que el usuario conoce como un ingreso de X
euros, la computacin lo interpretar como una accin llevada
a cabo en una fecha y momento determinado, en un lugar
Datos estructurados: concreto, entre unos usuarios registrados, y ms metadatos.

Datos que tienen bien definidos su longitud y su formato,


como las fechas, los nmeros o las cadenas de caracteres. Se
almacenan en tablas. Un ejemplo son las bases de datos
relacionales y las hojas de clculo.
Datos no estructurados: Marketing electrnico y web:

Datos en el formato tal y como fueron recolectados, Se generan una gran cantidad de datos cuando se navega por
carecen de un formato especfico. No se pueden internet. Con la web 2.0 se ha roto el paradigma webmaster-
almacenar dentro de una tabla ya que no se puede contenido-lector y los mismos usuarios se convierten en
desgranar su informacin a tipos bsicos de datos. creadores de contenido gracias a su interaccin con el sitio.
Algunos ejemplos son los PDF, documentos multimedia, Existen muchas herramientas de seguimiento utilizadas en su
correos electrnicos o documentos de texto. mayora con fines de marketing y anlisis de negocio. Los
movimientos de ratn quedan grabados en mapas de calor y usuario y que han sido calculados con anterioridad. Apache
queda registro de cunto pasamos en cada pgina y cundo las Cassandra es la tecnologa de almacenamiento clave-valor
visitamos. ms reconocida por los usuarios.

Mquina a mquina (machine to machine, M2M): Almacenamiento documental:


Son las tecnologas que comparten datos con dispositivos: Las bases de datos documentales guardan un gran parecido
medidores, sensores de temperatura, de luz, de altura, de con las bases de datos Clave-Valor, diferencindose en el dato
presin, de sonido que transforman las magnitudes fsicas o que guardan. Si en la anterior no requera una estructura de
qumicas y las convierten en datos. Existen desde hace datos concreta, en este caso guardamos datos
dcadas, pero la llegada de las comunicaciones inalmbricas semiestructurados. Estos datos pasan a llamarse documentos,
(Wi-Fi, Bluetooth, RFID) ha revolucionado el mundo de los y pueden estar formateados en XML, JSON, Binary JSON o el
sensores. Algunos ejemplos son los GPS en la automocin o que acepte la misma base de datos.
los sensores de signos vitales en la medicina.
Todos los documentos tienen una clave nica con la que puede
ser accedido e identificado explcitamente. Estos documentos
no son opacos al sistema, por lo que pueden ser interpretados
Biomtrica:
y lanzar queries sobre ellos. Un ejemplo que aclare cmo se
Son el conjunto de datos que provienen de la seguridad, usa lo encontramos en un blog: se almacena el autor, la fecha,
defensa y servicios de inteligencia. Son cantidades de datos el ttulo, el resumen y el contenido del post.
generados por lectores biomtricos como escneres de retina,
CouchDB o MongoDB son quiz las ms conocidas. Hay que
escneres de huellas digitales, o lectores de cadenas de ADN.
hacer mencin especial a MapReduce, una tecnologa de
El propsito de estos datos es proporcionar mecanismos de
Google inicialmente diseada para su algoritmo PageRank,
seguridad y suelen estar custodiadas por los ministerios de
que permite seleccionar un subconjunto de datos, agruparlos o
defensa y departamentos de inteligencia. Un ejemplo de
reducirlos y cargarlos en otra coleccin, y a Hadoop que es
aplicacin es el cruce de ADN entre una muestra de un crimen
una tecnologa de Apache diseada para almacenar y procesar
y una muestra en nuestra base de datos.
grandes cantidades de datos.

NOSQL
Almacenamiento en grafo:
Almacenamiento NoSQL
Las bases de datos en grafo rompen con la idea de tablas y se
El trmino NoSQL se refiere a Not Only SQL y son sistemas basan en la teora de grafos, donde se establece que la
de almacenamiento que no cumplen con el esquema entidad- informacin son los nodos y las relaciones entre la
relacin. Proveen un sistema de almacenamiento mucho ms informacin son las aristas, algo similar en el modelo
flexible y concurrente y permiten manipular grandes relacional. Su mayor uso se contempla en casos de relacionar
cantidades de informacin de manera mucho ms rpida que grandes cantidades de datos que pueden ser muy variables. Por
las bases de datos relacionales. ejemplo, los nodos pueden contener objetos, variables y
atributos diferentes en unos y los otros. Las operaciones de
Distinguimos cuatro grandes grupos de bases de datos join se sustituyen por recorridos a travs del grafo, y se guarda
NoSQL: una lista de adyacencias entre los nodos. Encontramos un
ejemplo en las redes sociales: en Facebook cada nodo se
considera un usuario, que puede tener aristas de amistad con
Almacenamiento clave-valor (key-value): otros usuarios, o aristas de publicacin con nodos de
Los datos se almacenan de forma similar a los mapas o contenidos. Soluciones como Neo4J y GraphDB son las ms
diccionarios de datos, donde se accede al dato a partir de una conocidas dentro de las bases de datos en grafo.
clave nica. Los valores (datos) son aislados e independientes
entre ellos, y no son interpretados por el sistema. Pueden ser
variables simples como enteros o caracteres, u objetos. Por
otro lado, este sistema de almacenamiento carece de una Almacenamiento orientado a columnas:
estructura de datos clara y establecida, por lo que no requiere
un formateo de los datos muy estricto. Por ltimo, el almacenamiento Column-Oriented es parecido
al Documental. Su modelo de datos es definido como un
Son tiles para operaciones simples basadas en las claves. Un mapa de datos multidimensional poco denso, distribuido y
ejemplo es el aumento de velocidad de carga de un sitio web persistente. Se orienta a almacenar datos con tendencia a
que pueden utilizar diferentes perfiles de usuario, teniendo escalar horizontalmente, por lo que permite guardar diferentes
mapeados los archivos que hay que incluir segn el id de atributos y objetos bajo una misma clave. A diferencia del
documental y el clave-valor, en este caso se pueden almacenar estndares, las bases de datos NoSQL tienen pocas
varios atributos y objetos, pero no sern interpretables normas en comn. Cada base de datos NoSQL tiene
directamente por el sistema. Permite agrupar columnas en su propia API, las interfaces de consultas son nicas
familias y guardar la informacin cronolgicamente, y tienen peculiaridades. Esta falta de normas significa
mejorando el rendimiento. Esta tecnologa se acostumbra a que es imposible cambiar simplemente de un
usar en casos con 100 o ms atributos por clave. Su precursor proveedor a otro, por si no quedara satisfecho con el
es BigTable de Google, pero han aparecido nuevas soluciones servicio.
como HBase o HyperTable.

CONCLUSIONES
Ventajas
El uso de Big Data ha ayudado a los investigadores a
Estos sistemas responden a las necesidades de descubrir cosas que les podran haber tomado aos en
escalabilidad horizontal que tienen cada vez ms descubrir por si mismos sin el uso de estas
empresas.3 herramientas, debido a la velocidad del anlisis, es
posible que el analista de datos pueda cambiar sus
Pueden manejar enormes cantidades de datos. ideas basndose en el resultado obtenido y retrabajar
No generan cuellos de botella. el procedimiento una y otra vez hasta encontrar el
verdadero valor al que se est tratando de llegar.
Escalamiento sencillo.
IBM cuenta con una plataforma de Big Data basada
Diferentes DBs NoSQL para diferentes proyectos. en dos productos principales: IBM InfoSphere
Se ejecutan en clusters de mquinas baratas. BigInsights e IBM InfoSphere Streams.
Implementar una solucin alrededor de Big Data
implica de la integracin de diversos componentes y
Desventajas proyectos que en conjunto forman el ecosistema
necesario para analizar grandes cantidades de datos.
Las bases de datos NoSQL al ser de cdigo abierto
poseen un soporte diferente al soporte que ofrecen las Sin una plataforma de Big Data se necesitara que
compaas comerciales a sus productos. La desarrollar adicionalmente cdigo que permita
comunidad open source, si bien podra responder a administrar cada uno de esos componentes como por
cualquier problema, posiblemente se puedan tardar ejemplo: manejo de eventos, conectividad, alta
ms que una compaa comercial de cdigo disponibilidad, seguridad, optimizacin y desempeo,
propietario. depuracin, monitoreo, administracin de las
aplicaciones, SQL y scripts personalizados.
No estn lo suficientemente maduros para algunas
empresas.- A pesar de sus puestas en prctica en
algunas grandes empresas, las bases de datos NoSQL
an se enfrentan a un problema de credibilidad
importante con muchas empresas. Los crticos
sealan la falta de madurez de NoSQL y los posibles III. REFERENCIA
problemas de inestabilidad, mientras que citan la
madurez, y una gran funcionalidad y estabilidad de [1] macrodatos e inteligencia de datos, alternativas a big data.
los RDBMSes. Consultado el 11 de abril de 2017.
[2] Douglas, Laney. 3D Data Management: Controlling Data
Volume, Velocity and Variety. Gartner. Consultado el 6 de
La falta de experiencia.- La novedad de NoSQL febrero de 2001. ESA Bulletin 131. August 2007.
significa que no hay una gran cantidad de [3] Lopez Garca, David (2012-2013). Analysis of the possibilities
desarrolladores y administradores que conocen la of use of Big Data in organizations. Consultado el 18 de octubre
tecnologa -lo que hace difcil a las empresas de 2014.
encontrar personas con los conocimientos tcnicos [4] NoSQL Relational Database Management System: Home
apropiados. Por el contrario, el mundo RDBMS tiene Page. Strozzi.it. 2 de octubre de 2007. Consultado el 29 de
marzo de 2010.
miles de personas muy cualificadas.
Problemas de compatibilidad.- A diferencia de las
bases de datos relacionales, que comparten ciertos

Вам также может понравиться