You are on page 1of 11

ESCUELA SUPERIOR POLITCNICA DE CHIMBORAZO

FACULTAD DE INFORMTICA Y ELECTRNICA


ESCUELA DE INGENIERA EN SISTEMAS

SOLUCIONES TECNOLOGICAS INTEGRALES DE EMPRESAS

INTEGRANTES:
Patricia Allauca

5211

Maritza Chicaiza

4469

Geoconda Sagay

4340

Lenin Velastegui

4514

TEMA:
BIG DATA

FECHA DE ENTREGA:

23-04-2014
RIOBAMBA-ECUADOR

INTRODUCCION

La gran cantidad de datos que se generan diariamente es tan enorme que las tecnologas de
bases de datos actuales se estn quedando obsoletas y esto puede plantear un gran problema
a las empresas; y mientras la digitalizacin ha acelerado el crecimiento de los datos en
todas las organizaciones
La capacidad para almacenar, consolidar y fusionar informacin ha hecho que las empresas,
organismos pblicos, analistas construyan centros de datos para satisfacer una demanda y
as estn librando una batalla tecnolgica para descifrar y gestionar grandes conjuntos de
datos o big data. Pero las empresas tienen que ser capaces de afrontar esta batalla, es decir
no desaprovechar las oportunidades que se presenten para de esta manera no perder la
ventaja competitiva.
Esta tendencia en el avance de la tecnologa ha abierto las puertas hacia un nuevo
enfoque de entendimiento y toma de decisiones, la cual es utilizada para describir enormes
cantidades de datos ya sean estructurados, no estructurados y semi estructurados que
tomara demasiado tiempo y sera muy costoso cargarlos a un base de datos relacional para
su anlisis.
El presente documento trata de presentar la tecnologa denominada Big Data como una
solucin para la gestin de los datos dentro de una organizacin permitiendo identificar
conceptos, caractersticas, fases, aplicaciones, entre otros.

OBJETIVOS:
OBJETIVO GENERAL
Proporcionar informacin completa del Big Data para obtener mayor conocimiento
en el mundo de los negocios a la hora de tomar decisiones.
OBJETIVOS ESPECIFICOS

Determinar los datos con los que trababa un Big Data para entender y mejorar su
representacin.
Determinar las caractersticas de un Big Data y mostrar que beneficios
proporcionara su adopcin en las funciones empresariales.
Determinar las fases de un Big Data a la hora de procesar grandes volmenes de
datos.
Conocer los casos de uso de un Big Data que se estn implantando para ofrecer una
solucin eficiente.
Establecer campos de aplicacin de un Big Data para resolver un problema de
negocio de un modo ms significativo.

MARCO TEORICO

BIG DATA
DEFINICIN:
Big Data es un trmino aplicado a conjuntos de datos que superan la capacidad del software
habitual para ser capturados, gestionados y procesados en un tiempo razonable, estos son
activos de informacin caracterizados por su alto volumen, velocidad y variedad, que
demandan soluciones innovadoras y eficientes de procesado para la mejora del
conocimiento y toma de decisiones en las organizaciones.

Big Data es un gran banco de datos disponibles para las empresas, con los que pueden
trabajar con ms dedicacin en los gustos especficos de los usuarios, de forma casi que
personalizada. Es un valioso recurso de informacin para disear estrategias ms vlidas y
reales.
Contando con informacin ms precisa, se minimiza los riesgos en la formulacin de
estrategias y polticas de mercado. La comunicacin directa con el cliente, tambin
permitir una serie de reformas en productos o servicios, gracias a los aportes de los
diferentes criterios y opiniones.
TIPOS DE DATOS
1. Web and Social Media: Incluye contenido web e informacin que es obtenida de
las redes sociales como Facebook, Twitter, blogs.
2. Machine-to-Machine (M2M): M2M se refiere a las tecnologas que permiten
conectarse a otros dispositivos. M2M utiliza dispositivos como sensores o
medidores que capturan algn evento en particular como velocidad, temperatura,
presin, variables meteorolgicas, variables qumicas los cuales transmiten a travs
de redes almbricas, inalmbricas o hbridas a otras aplicaciones que traducen estos
eventos en informacin significativa.
3. Big Transaction Data: Incluye registros de facturacin, en telecomunicaciones
registros detallados de las llamadas. Estos datos transaccionales estn disponibles en
formatos tanto semi-estructurados como no estructurados.

4. Biometrics: Informacin biomtrica en la que se incluye huellas digitales, escaneo


de la retina, reconocimiento facial, gentica, etc. En el rea de seguridad e
inteligencia, los datos biomtricos han sido informacin importante para las
agencias de investigacin.
5. Human Generated: Las personas generamos diversas cantidades de datos como la
informacin que guarda un call center al establecer una llamada telefnica, notas de
voz, correos electrnicos, documentos electrnicos, estudios mdicos, etc.
A Big Data le caracterizan las tres "V": volumen, variedad y velocidad:

Volumen
-

El volumen de los datos almacenados en los depsitos de las


empresas ha pasado de ocupar megabytes y gigabytes a
petabytes.

Por ejemplo, el volumen de datos procesado por


corporaciones ha crecido significativamente. Google procesa
20 petabytes al da.

Variedad

La variedad tiene que ver con gestionar la complejidad de


mltiples tipos de datos, pasando de ser datos almacenados y
estructurados, guardados en bancos de datos empresariales, a
ser desestructurados, semi estructurados, audio, video, XML,
etc.

Una creciente variedad de datos necesitan ser procesados y


convertidos en informacin.

Velocidad

La velocidad del movimiento, proceso y captura de datos dentro


y fuera de la empresa ha aumentado significativamente.

La velocidad afecta el tiempo de espera entre el momento en el


que se crean los datos, el momento en el que se captan y el
momento en el que estn accesibles.
Para los procesos en los que el tiempo resulta fundamental, tales
como la deteccin de fraude en tiempo real o el marketing

instantneo multicanal, ciertos tipos de datos deben analizarse en tiempo real para
que resulten tiles para el negocio.
-

eBay, por ejemplo, se enfrenta al fraude a travs de PayPal analizando cinco


millones de transacciones en tiempo real al da.

CUATRO GRANDES PILARES DE BIG DATA

Considerando los conceptos de las V de Big Data, esta se relaciona con cuatro grandes
pilares, estos son:
Almacenamiento: con un crecimiento exponencial, en medios ms rpidos, efectivos,
confiables, y robustos.

Transferencia: consiste en la necesidad de transmitir grandes volmenes de datos en


tiempo real permitiendo realizar anlisis precisos y certeros.

Procesamiento: un framework de procesamiento como hadoop.

Visualizacin: el cmo se muestren los resultados siempre ser importante.

FASES EN BIG DATA


Pasos que hay que seguir a la hora de procesar grandes volmenes de informacin.
1.

Adquisicin de datos y grabacin.- Es la primera fase de cualquier solucin Big Data.


Es necesario definir qu datos vamos a necesitar desde nuestra fuente de informacin, como
puede ser los de nuestras aplicaciones, proveniente de una red social o a travs de simples
ficheros de datos.

2.

Extraccin y pre procesamiento de la informacin.- Una vez adquiridos los datos a


tratar se necesita estructurar estos datos para que sean posteriormente procesados y
analizados. Para ello debemos limpiar los datos recogidos durante la fase 1 de manera que
se obtenga un subconjunto estructurado de los mismos con la informacin relevante a tratar.

3.

Representacin, agregacin e integracin de datos.- En este paso se debe encontrar


las relaciones entre los distintos datos que conforman el conjunto de la informacin que
tenemos disponible en nuestro problema. Previamente a realizar el anlisis de los datos se
necesitar desde almacenar nuestros datos estructurados en bases de datos o sistemas que se
utilizarn en la siguiente fase.

4.

Procesamiento de peticiones, modelado de datos y anlisis.- Esta rea se encarga de


manipular, procesar, modelar, analizar y extraer la informacin que se necesite dado un
problema determinado. La minera de datos se fundamenta en procesos algortmicos y
estadsticos para resolver esta serie de tareas.
5.
Interpretacin de los datos.- Una vez extrada la informacin se debe interpretar estos
datos lo que dar como resultado el final del problema. Hay que tener en cuenta que los
datos extrados pueden tener distinto tipo de interpretaciones posibles en funcin del mbito
del problema.
FORMAS DE IMPLEMENTAR BIG DATA
Dependiendo del grado de almacenamiento y procesamiento que se busque, de los recursos
con que se cuente y del perfil tecnolgico del negocio, se implementar Big Data utilizando
cualquiera de los siguientes modelos de desarrollo:
- Modelos Tradicionales: se puede hacer Big Data con este modelo, pero, de hecho,
quienes optan por l se encuentran con dificultades a la hora de cargar datos, ya que existen
ciertas limitaciones que lo causan. Su principal desventaja es el elevado coste que implica,
obligando a limitar el tamao de datos que gestionan.
- Modelo UAP (Unified Analytic Platform): da respuesta tanto al problema de
almacenamiento como el de procesamiento de la informacin por su capacidad de
escalamiento. Uno de sus puntos fuertes es su sencillo manejo e instalacin, ya que todo
est preparado y preinstalado, listo para empezar a cargar datos. Adems sus capacidades de
rendimiento pueden aumentarse a peticin, tan solo incorporando nuevos nodos.
- Modelo Cloud: la nube se est convirtiendo en una plataforma convincente para
administrar grandes volmenes de datos y se puede utilizar en un sistema hbrido con
entornos locales. En este caso slo hace falta tener acceso al servicio de almacenamiento,
con lo que se ahorra espacio, costes de mantenimiento, de actualizacin, etc. La desventaja
de este modelo es la fragmentacin, algo que puede hacer que muchas empresas se
muestren reacias. Sin embargo, su ventaja ms importante es la escalabilidad dinmica que
garantiza, algo imprescindible para desarrollar el Big Data.
CASOS DE USO
La aparicin de Big Data permite almacenar y tratar datos de una manera ms eficiente,
derivando en diversos casos de uso en los que su arquitectura puede ofrecer una solucin
eficiente. Muchos de estos casos de uso tienen como objetivo mejorar los procesos internos

de las empresas, reduciendo su coste y tiempo a la vez que mejoran el resultado obtenido al
reducir la cantidad de informacin descartada o tratada.
ANLISIS DE NEGOCIOS
Una de las principales razones de las compaas para desarrollar o usar tecnologas Big
Data es la de mejorar sus procesos de negocios. Disciplinas como la relacin con el cliente,
la administracin de capital o la toma de decisiones, poltica de precios entre otras son las
ms beneficiadas. Gracias a esto, las compaas pueden incrementar sus beneficios,
disminuir los costes o hacer un anlisis de riesgos.
ANLISIS DE SENTIMIENTO
Hasta hace pocos aos, cuando una compaa quera conocer cul era la opinin que los
usuarios tenan sobre ella, sus productos o sus servicios tenan que recurrir a encuestas y/o
formularios, realizar grandes estudios de investigacin sin embargo hoy en da, con la
aparicin de las redes sociales -como Twitter o Facebook- es ms fcil obtener la opinin
de los consumidores, obteniendo una valoracin ms natural y espontnea.
SEGURIDAD
Uno de los casos de uso ms comunes y que las nuevas tecnologas Big Data han facilitado
y mejorado su prctica es el de seguridad. Un anlisis completo de seguridad puede llegar a
involucrar muchas fuentes de informacin como logs, transacciones con los clientes o
distintos sensores. Las tecnologas Big Data permiten almacenar todo el contenido no
estructurado ofrecido por estas fuentes sin tener que hacer una preseleccin o cualquier tipo
de proceso.
Algunos de los ejemplos ms especficos son la deteccin de ataques cibernticos como
malware en el sistema o phishing por ejemplo en entidades bancarias para detectar intentos
de fraude o localizar a una persona o su telfono.
APLICACIONES DEL BIG DATA
Numerosas empresas y organizaciones de todo el mundo necesitan almacenar y gestionar
correctamente este aluvin de datos e informacin que se genera diariamente, la tecnologa
Big data se aplica indistintamente en numerosos campos y sectores, dentro del mbito de la
empresa privada, en organizaciones y centros cientficos incluso gobiernos que gestionan
ciudades y pases enteros han encontrado en esta tecnologa su mejor ganancia que les
permite optimizar sus tomas de decisiones y sus resultados.
Empresas privadas:
En numerosas ocasiones la informacin captada por empresas privadas son tratadas y
analizadas con el objetivo de aumentar sus ventas y ganancias, por ejemplo empresas como
Google, Amazon o Apple presentan anuncios personalizados a los gustos y necesidades del
usuario tras un anlisis de las bsquedas o compras realizadas, por otro lado dicha
informacin les permite a las empresas predecir futuras demandas de un producto o mejorar
las prestaciones que ofrecen a sus usuarios.

mbito cientfico:
Big data se utiliza en numerosas aplicaciones como por ejemplo la prediccin
meteorolgica, el estudio del genoma o el anlisis de la composicin de la materia.

Los gobiernos:
Utilizan esta tecnologa para mejorar los servicios que prestan a sus ciudadanos, unas de las
aplicaciones en donde se ha aplicado la tecnologa big data ha sido en la ciudad francesa de
Lyon, gracias a esta tecnologa junto con la captura de datos mediante sensores repartidos
por toda la ciudad se ha podido analizar las congestiones de trfico con el objetivo de
predecir en cualquier momento cuando se va a producir un atasco de tal manera que
cambian automticamente las seales de trfico con el objetivo de mejorar el flujo
circulatorio.
Los partidos polticos:
Utilizan estas nuevas tecnologas para alcanzar un mayor nmero de votos, conocido fue el
caso de la campaa de Barack Obama en el ao 2012 en el que utiliz Big data para
acercarse y conocer los gustos y necesidades de sus ciudadanos permitindole realizar
discursos y programas polticos adecuados a las necesidades de sus ciudadanos.
El sector industrial:
Big data la tecnologa perfecta que mejora sus procesos, por ejemplo el uso de sensores que
registran datos sobre el estado de los componentes de una mquina con su posterior
tratamiento el cual nos permitir predecir el mantenimiento de una manera ms efectiva
ahorrando tiempo y costes innecesarios.
Aplicaciones para analizar valores de las acciones o el estado del trfico en tiempo real,
otras aplicaciones que nos permiten predecir tendencias de comercio, crimen hasta incluso
cuando se producir un brote vrico o epidemia en una poblacin, aunque parezca una
visin futurista hoy en da es real gracias a la tecnologa big data.
Google ha aplicado big data en aplicaciones como su traductor de idiomas automtico,
mediante las herramientas big data google volc toda la informacin rastreada en Internet
comparando documentos oficiales traducidos de un idioma a otro as pginas webs
personales, esta gigantesca base de datos ha permitido a Google desarrollar el mejor
traductor de idiomas presente actualmente.

Big data puede aplicarse tanto en empresas multinacionales como Facebook o Coca-Cola
as como en pequeas empresas, por ejemplo el caso de una pequea empresa que tras
aplicar Big data a un perfil determinado de usuarios de una red social obtiene informacin
til para generar un nuevo servicio que satisfaga las necesidades de dichos usuarios
consiguiendo nuevos clientes.

CONCLUSIONES Y RECOMENDACIONES
CONCLUSIONES:
Un big data trabaja con una gran variedad de datos, que son procesados y analizados
para luego ser interpretados y de esta manera convertirse en informacin til para la
organizacin, dependiendo del mbito del problema a resolver se podr usar esta
informacin de mejor manera para la toma de decisiones.
En una organizacin existe gran cantidad de informacin de diferente tipo que
muchas veces debe ser analizada en tiempo real para la toma de decisiones el uso de
big data ha mejorado la interpretacin de estos datos generando un avance en la
productividad y la competitividad de las empresas u organizaciones.
Al analizar los grandes volmenes de datos genera distintos tipos de problemas de
confianza en el mundo corporativo por lo que el mayor obstculo del Big Data no es
tanto lograr el xito, sino que radica en hacer que la gente crea y confe en los Big
Data para ello se debe seguir una secuencia de pasos.
Aporta con soluciones eficientes ya que los Big Data realizan un anlisis orientados
a clientes que tienen problemas que antes no eran planteables ahora s se consiguen
resolver.
Ayuda a resolver problemas porque aportan con predicciones que soporten las
decisiones que tiene que tomar su lnea de negocio, su proyecto o su empresa.
RECOMENDACIONES:
-

A las empresas para competir en una economa integrada a escala global puesto que
es evidente que hoy en da necesitan una comprensin absoluta de los mercados, los
clientes, los productos, las normativas, los competidores, los proveedores, los
empleados y mucho ms.

Para entender la utilizacin del Big Data en las organizaciones se debe realizar
talleres de consulta, asesora, diseo e implementacin desde sus propias
necesidades en infraestructura y requerimientos futuros como empresa.

Para las organizaciones que utilicen y gestionen grandes cantidades de informacin


ya sean stas estructuradas, no estructurados o semi-estructurados que tomara
demasiado tiempo y sera muy costoso cargarlos a un base de datos relacional para
su anlisis.

BIBLIOGRAFA
(14 de 08 de 2010). Recuperado el 19 de 04 de 2014, de
http://www.euskadinnova.net/documentos/2343.aspx
(18 de 06 de 2012). Recuperado el 14 de 04 de 2014, de
http://www.ibm.com/developerworks/ssa/local/im/que-es-big-data/
(13 de 06 de 2013). Recuperado el 19 de 04 de 2014, de
http://www.autanacrm.com/index.php/es/enblog/Entrada/39-peque
%C3%B1a-introducci%C3%B3n-a-big-data
(12 de 09 de 2013). Recuperado el 17 de 04 de 2014, de
http://www.biblogtecarios.es/saulequihua/hablemos-sobre-big-data/
(06 de 06 de 2013). Recuperado el 17 de 04 de 2014, de
https://www.centrodeinnovacionbbva.com/magazines/innovationedge/publications/21-big-data/posts/153-big-data-en-que-punto-estamos
(27 de 08 de 2013). Recuperado el 18 de 04 de 2014, de
http://java4developers.com/2013/fases-en-big-data-y-su-relacion-conlibreerias-hadoop/
(20 de 02 de 2014). Recuperado el 19 de 04 de 2014, de
http://www.cnis.es/index.php?
option=com_content&view=article&id=434:concepto-bigdata&catid=47:noticias-boletin-cnis&Itemid=57