Академический Документы
Профессиональный Документы
Культура Документы
BUSCAMEDIA
HACIA UNA ADAPTACIÓN SEMÁNTICA DE MEDIOS DIGITALES
MULTIRRED- MULTITERMINAL
PROYECTO CENIT-E
Cloud computing
Ana Juan Ferrer, Jose Miguel Garrido
Atos Origin
AVISO LEGAL
El trabajo asociado a este documento se ha llevado a cabo de acuerdo con las mayores garantías de calidad técnica y los socios de
BUSCAMEDIA se han comprometido a alcanzar este nivel de rigor con el trabajo en cuestión. No obstante los socios de BUSCAMEDIA
no tienen control sobre quién recibe la información de este documento, por lo que no se hacen responsables del uso que se pueda hacer
de dicha información.
Se permite su copia y distribución por cualquier medio siempre que se mantenga el reconocimiento de sus autores, no se haga uso
comercial de las obras y no se realice ninguna modificación de las mismas
1
Cloud computing es un estilo de computación cuál sea la ubicación de su infraestructura. En
escalable donde las capacidades de entornos un sistema Cloud, normalmente se da a los
de TI son entregadas como un servicio a usuarios la posibilidad de abastecerse
clientes externos utilizando las tecnologías de únicamente de los recursos estrictamente
Internet. necesarios. En principio, de cara a los
Telefónica I+D y SAP lo definen como: usuarios, el sistema tiene unos recursos
infinitos, que puede solicitar según su
Los Clouds en definitiva son un gran número necesidad sin preocuparse de problemas de
de recursos generalmente virtuales fácilmente asignación de recursos.
utilizables y accesibles tales como hardware,
plataformas de desarrollo y/o servicios. Estos Normalmente, el usuario puede beneficiarse de
recursos pueden ser reconfigurados un modelo de pago por uso de estos servicios
dinámicamente para adaptarse a una carga mediante un acuerdo general de servicio (SLA)
variable (escalable) así como permitir una y conociendo a priori el coste que supondrá su
óptima utilización de los recursos. Este utilización durante un cierto periodo de tiempo.
conjunto de recursos puede ser explotado por Esta es la perspectiva que verán las personas
el proveedor de la infraestructura a través de que usen Buscamedia. Buscamedia será una
un modelo de pago por uso por medio de aplicación “desde la nube”, la mayor parte de
SLAs personalizados. la funcionalidad estará accesible por medio de
La definición NIST (National Institute of Internet y el usuario no tendrá necesidad de
Standards) de Cloud Computing es: preocuparse por la asignación de recursos.
Nº DE IDENTIFICACIÓN EXPEDIENTE CEN-20091026 | ACRÓNIMO DEL PROYECTO BUSCAMEDIA
conseguir eficiencia y predictibilidad con el aplicación SaaS, sobre todo en los aspectos
objetivo de crear una infraestructura auto- como buscador.
reparable en caso de fallo.
PLATAFORMA COMO SERVICIO (PaaS):
En el caso de Buscamedia, usando una
En este nivel se encuentran los proveedores
arquitectura Cloud en vez de una tradicional
de entornos Cloud que suministran a los
para el Centro de Proceso de Datos, se
desarrolladores una interface programática
pretende aprovechar las ventajas de
con un conjunto de APIs y entornos de
escalabilidad. No se pretende que el CPD sea
ejecución bien definidos para facilitar la
compartido con otras aplicaciones, pero sí que
interacción y creación de los diferentes
tenga la flexibilidad para responder a las
entornos y aplicaciones en el Cloud.
necesidades computacionales.
Se distinguen dos tipos de plataformas: las
Cloud stack
que permiten la personalización de los
Se suele dividir el modelo Cloud en capas o servicios de un proveedor de SaaS y las que
niveles, cada uno de ellos proporciona un nivel permiten la interacción con los diferentes
mayor de abstracción en el servicio y puede servicios de infraestructura de un proveedor
estar compuesto utilizando el nivel inferior. (IaaS).
Existen otras clasificaciones que distinguen
En esta categoría se incluyen plataformas
mas niveles pero la clasificación en 3 niveles
como Google App Engine, Microsoft Azure o
es con mucho la más extendida.
Sales de Salesforce.com.
SOFTWARE COMO SERVICIO (SaaS): Buscamedia no va a ofrecer servicios PaaS a
En la parte más alta, encontramos la capa de usuarios finales. En este momento no es
aplicaciones provistas en el Cloud. Es la previsible el uso de un modelo PaaS dentro
primera que aparece incluso antes que el de la arquitectura de Buscamedia.
concepto Cloud Computing, siendo el más INFRAESTRUCTURA COMO SERVICIO (IaaS):
extendido en la actualidad. Es un modelo de
En ocasiones también llamado “Hardware
provisión de software donde las aplicaciones
como Servicio”, plantea la posibilidad de
están alojadas en infraestructuras externas a la
aprovisionar parte de una infraestructura como
del consumidor, son accesibles a los usuarios
un servicio. Generalmente estas
a través de Internet, disponibles bajo demanda
infraestructuras se presentan como un entorno
y generalmente con un modelo de pago por
virtualizado.
uso o gratuito.
Está enfocado a evitar la infra-utilización de las
Los ejemplos de software como servicio son
infraestructuras, dando la posibilidad de
numerosos, siendo uno de los más conocidos
reaprovechar los servidores, el espacio en los
Google Docs, pero en general cualquier
centros de datos y los equipamientos de red.
servicio “desde la nube” para usuarios finales
se puede considerar SaaS, incluyendo IaaS esta ejemplificado como mayor
buscadores multimedia como Youtube. Se exponente por Amazon Web Services o Elastic
espera que gran parte de las aplicaciones Compute Cloud (EC2), de los que hablaremos
tradicionales migren a un modelo SaaS en el más adelante.
futuro.
Se pretende que Buscamedia emplee
Buscamedia desde el punto de los clientes herramientas de IaaS para crear la
finales se puede considerar en general una infraestructura escalable del Centro de
Proceso de Datos, aunque no ofrezca
3
servicios de IaaS a clientes finales. Además, Se puede ver al Cloud privado como la
Buscamedia pretende hacer uso de las evolución del uso de la virtualización en el
tecnologías de IaaS en conjunción con Centro de Proceso de Datos de una
herramientas de análisis distribuido de datos organización.
tipo Hadoop para el proceso distribuido y
CLOUD HÍBRIDOS:
paralelo de grandes volúmenes de datos
requeridos por Buscamedia para la indexación Se llama Cloud hibrido a unir un Cloud privado
de contenidos. con un Cloud público y usar una combinación
de ambos según las necesidades provocadas
Modelo de negocio
por la demanda.
Las clasificaciones anteriores son adecuadas
La posibilidad inmediata para Buscamedia es
desde el punto de vista técnico, pero en la
el despliegue en un Cloud privado, organizar el
práctica, una forma muy conveniente y muy
Centro de Proceso de Datos utilizando
utilizada para clasificar las distintas tipologías
herramientas Cloud.
de Cloud Computing es basándose en su
modelo de negocio o de quien es la propiedad No obstante, mediante el uso de tecnologías
de los recursos computacionales. adecuadas, es posible hacer una transición
sencilla a un Cloud público comúnmente
CLOUD PÚBLICO
utilizado. De este modo, se asegura que
Son análogos a las compañías suministradoras Buscamedia puede disponer de unos recursos
de “utilities” o “commodities” como agua o potencialmente ilimitados para responder a
electricidad. cualquier demanda.
Ejemplos clave incluyen Amazon Web Services Cloud públicos: Amazon Web Services
(como EC2 para computo y S3 para
La tienda online Amazon es actualmente el
almacenamiento), y Cloud Files y Cloud
líder en servicios de Cloud Computing gracias
Servers de Rackspace.
entre otras cosas a que fue uno de los
Incluyen un método de facturación muy primeros jugadores en el mercado. Luego ha
granular (llegando a cobrar por hora o sabido abrir nuevos nichos y mantener con
kilobyte), contando el servidor o el volumen de precio y calidad su ventaja inicial, hasta
almacenamiento como la unidad básica de convertirse en un estándar de facto. En la
gestión, y por supuesto, ofrecen la habilidad actualidad Amazon tiene en torno a 20
de obtener un gran número de servidores o servicios, los más conocidos e importantes
almacenamiento solo unos minutos después para Buscamedia son EC2 y S3
del pago sin necesidad de firmar un contrato.
Amazon EC2 (Elastic Computiong Cloud) es el
CLOUD PRIVADO CERRADO caso que ejemplifica mejor lo que se pretende
de un Cloud computing. Es un servicio web
Se trata de un Cloud usado exclusivamente
ofrecido remotamente que proporciona
por una única organización y no incorporado a
capacidad de cómputo en la nube,
ninguna clase de Cloud público. ¿Cuándo
redimensionable bajo demanda. EC2 ofrece un
debe una organización crear su propio Cloud
servicio de alquiler de maquinas virtuales
privado? ¿Qué tipo de organizaciones deben
donde desplegar las aplicaciones.
hacerlo? La respuesta es que un Cloud
privado es óptimo para organizaciones con Es el principal caso de éxito en las
datos altamente sensibles, regulados por ley, o infraestructuras como servicio (IaaS),
que tienen requerimientos extremadamente proporcionando tanto a particulares como
altos de prestaciones y almacenamiento. organizaciones capacidad de cómputo y
Nº DE IDENTIFICACIÓN EXPEDIENTE CEN-20091026 | ACRÓNIMO DEL PROYECTO BUSCAMEDIA
almacenamiento, así como un sistema de Una de sus ventajas es que ofrece un interfaz
pago por uso de los recursos. compatible con EC2 y S3 de Amazon. De este
modo, una aplicación diseñada para funcionar
Amazon S3 (Simple Storage Service) es el
en un Cloud privado con Eucalyptus puede
servicio de almacenamiento de Amazon. Hay
migrar fácilmente a un cloud publico de
que tener en cuenta que las máquinas virtuales
Amazon, lo cual es muy interesante para
de EC2 son volátiles, pueden crearse en
Buscamedia.
cualquier momento pero como contrapartida
cuando son borradas su estado se pierde por HADOOP
completo.
Hadoop es un framework java que permite
S3 puede usarse para almacenar contenidos construir programas distribuidos usando el
multimedia. Pueden además ser accedidos no paradigma map-reduce. Hadoop se suele
solo mediante un protocolo HTTP, sino utilizar en el contexto de Cloud computing y es
también mediante P2P, pudiéndose integrar incluso ofrecido por Amazon dentro de su
por tanto en el esquema de distribución de oferta de servicios Cloud.
Buscamedia.
Aplicaciones eficientes en Cloud
Herramientas de Cloud
No todas las aplicaciones pueden funcionar en
Como se ha comentado, el proyecto un entorno Cloud sin modificaciones. Para
Buscamedia no se limita a poder usar un funcionar bien en un entorno Cloud, la
Cloud externo, sino que pretende implementar aplicación debe reunir unas características
su propia infraestructura de Cloud. mínimas:
Afortunadamente hay en el mercado un amplio
Funcionar en una plataforma difundida,
abanico de herramientas tanto comerciales
un estándar industrial como Windows
como de software libre que permiten crear un
o una distribución popular de Linux, o
Cloud privado sin necesidad de comenzar
preferentemente, ambos sistemas.
desde cero.
No requerir una versión concreta del
De la amplia oferta, por razones de espacio se
sistema operativo, sino que debe
comentan aquí solo las más intereasantes a
funcionar con la mayor posible
priori para Buscamedia.
independencia del nivel de
EUCALYPTUS actualización del sistema, versión del
kernel o service patch instalados.
El objetivo de este proyecto open source es
promover la investigación y desarrollo de las Poder funcionar en un entorno
tecnologías que ofrecen “servicios elásticos, virtualizado, y si es posible, tomar la
útiles y en la nube”, así como el estudio de las forma de imagen de disco duro virtual,
estrategias de asignación de recursos, que es muy fácil de enviar y distribuir y
acuerdos a nivel de servicio (SLA), políticas y se puede arrancar y parar a voluntad.
modelos de uso. Ha sido desarrollado en el
La aplicación no debe quedar
laboratorio MAYHEM por el Departamento de
vinculada después de la instalación a
Ciencia y Computación de la Universidad
un servidor específico, por ejemplo,
californiana de Santa Bárbara. Su objetivo
obligada a responder a un nombre de
inicial era servir como una herramienta para la
servidor concreto.
investigación del Cloud Computing, pero se ha
convertido en una solución de enorme interés
también en entornos de producción.
5
Ser capaz de llevar los datos consigo, conveniente es desplegar Buscamedia en un
pero no depender de que residan en Cloud privado usando una herramienta como
un lugar concreto inmutable. Eucalyptus, para luego si es necesario
desplegar la aplicación en un Cloud público si
En el mismo sentido, debe ser capaz
la demanda lo requiere.
de usar almacenamiento externo, pero
de forma configurable. Buscamedia puede usar Cloud computing
para lograr un mejor servicio en tres aspectos
Debe poder cambiar de nombre DNS,
críticos:
IP o dirección MAC sin problemas.
Para lograr un tiempo de respuesta
En general, debe ser una aplicación
más rápido, utilizando la computación
“bien educada” que no interfiera con
distribuida para realizar las búsquedas.
otras aplicaciones en la misma
Esto se lograría usando Hadoop sobre
máquina.
un cluster de maquinas virtuales
En general estas recomendaciones nacen del usando un Cloud similar a EC2.
carácter volátil de las maquinas virtuales que
Como repositorio de los contenidos,
se usan en Cloud computing, frente al carácter
empleando algo similar a S3 para la
permanente de las maquinas virtuales en
gestión del almacenamiento.
Centros de Proceso de Datos virtualizados, o
de las maquinas físicas en los CPD Se puede aprovechar la infraestructura
tradicionales. de un Cloud público para proporcionar
el ancho de banda para la distribución,
Todas estas consideraciones han de tenerse
teniendo en cuenta que el
en cuenta a la hora de desarrollar y desplegar
almacenamiento puede ser compatible
Buscamedia.
con P2P.
Conclusiones
En este documento se ha definido que es el
Cloud Computing y se ha visto como se puede
situar el proyecto Buscamedia dentro de los
distintos puntos de vista y clasificaciones del
mundo Cloud. Se ha visto que lo más
Nº DE IDENTIFICACIÓN EXPEDIENTE CEN-20091026 | ACRÓNIMO DEL PROYECTO BUSCAMEDIA
Referencias
[1]. “Utility computer, reality and beyond”, Springer 2009 (http://www.springerlink.com/content/m6947454583l173x)
[2]. “A Break in the Clouds: Towards a Cloud Definition”, (http://ccr.sigcomm.org/online/files/p50-v39n1l-vaqueroA.pdf)
[3]. Peter Mell and Tim Grance , “The NIST Definition of Cloud Computing”, Version 15, 10-7-09
(http://csrc.nist.gov/groups/SNS/cloud-computing/cloud-def-v15.doc)
[4]. Forrester, “Future View: The New Tech Ecosystems Of Cloud, Cloud Services, And Cloud Computing”, 2008,
(http://www.rpath.com/corp/images/stories/white_papers/rPath_WP_forresterfutureview.pdf)
[5]. Lamia Youseff , “Toward a Unified Ontology of Cloud Computing”,. University of California,
(http://www.cs.ucsb.edu/~lyouseff/CCOntology/CloudOntology.pdf)
[6]. “The Cloud Spectrum” (http://www.gridipedia.eu/cloud-spectrum.html)
[7]. Arma Partners, ’Software as a Service: Ride it while it’s hot! Whitepaper‘, 2007,
(http://www.armapartners.com/files/admin/uploads/W17_F_1873_34979.pdf)
[8]. Burton Group, ’SaaS Implementation Survey: Where, When, and How to use SaaS’, 2008, (
http://www.burtongroup.com/Guest/Ccs/SaasSurvey.aspx )
[9]. Forrester, “Cloud Computing for the Enterprise” Webminar, 2009,
(http://www.forrester.com/imagesV2/uplmisc/CloudComputingWebinarSlideDeck.pdf)
[10]. Information Week , ’Special Report: SaaS Red Light, Green Light‘,
(http://www.informationweek.com/news/software/hosted/showArticle.jhtml?articleID=207400212)
[11]. Agenda Estrategica de INES, GT “Infrastructuras Orientadas a Servicios”, (http://www.ines.org.es/docs/INES_AEI_v2_0.pdf)
[12]. Amazon EC2 (http://aws.amazon.com/ec2/)
[13]. Amazon S3 (http://aws.amazon.com/s3/)
[14]. Eucalyptus (http://open.eucalyptus.com/)
Jose Miguel Garrido es Ingeniero Industrial esp. Automática por la Universidad de Valladolid. En la actualidad trabaja en la unidad de
Media dentro de Atos Research and Innovation. Tiene experiencia en los sectores de telecomunicaciones, deportivos, defensa y
administraciones públicas. Ha colaborado en proyectos europeos como POLYMNIA, MIDAS, GAMA, ALIS o PuppyIR en el campo de las
telecomunicaciones y las tecnologías multimedia.